智能论文笔记

StRegA: Unsupervised Anomaly Detection in Brain MRIs using a Compact Context-encoding Variational Autoencoder

Soumick Chatterjee , Alessandro Sciarra , Max Dünnwald , Pavan Tummala , Shubham Kumar Agrawal , Aishwarya Jauhari , Aman Kalra , Steffen Oeltze-Jafra , Oliver Speck , Andreas Nürnberger

分类：计算机视觉 | 机器学习

2022-01-31

人脑解剖图像的专家解释是神经放射学的中心部分。已经提出了几种基于机器学习的技术来协助分析过程。但是，通常需要对ML模型进行培训以执行特定的任务，例如脑肿瘤分割或分类。相应的培训数据不仅需要费力的手动注释，而且人脑MRI中可以存在多种异常 - 甚至同时发生，这使得所有可能的异常情况都非常具有挑战性。因此，可能的解决方案是一种无监督的异常检测（UAD）系统，可以从健康受试者的未标记数据集中学习数据分布，然后应用以检测分布样本。然后，这种技术可用于检测异常 - 病变或异常，例如脑肿瘤，而无需明确训练该特定病理的模型。过去已经为此任务提出了几种基于变异的自动编码器（VAE）技术。即使它们在人为模拟的异常情况下表现良好，但其中许多在检测临床数据中的异常情况下表现较差。这项研究提出了“上下文编码” VAE（CEVAE）模型的紧凑版本，并结合了预处理和后处理步骤，创建了UAD管道（Strega）（Strega），该步骤对临床数据更强大，并显示其在检测到其检测方面的适用性脑MRI中的肿瘤等异常。 The proposed pipeline achieved a Dice score of 0.642$\pm$0.101 while detecting tumours in T2w images of the BraTS dataset and 0.859$\pm$0.112 while detecting artificially induced anomalies, while the best performing baseline achieved 0.522$\pm$0.135 and 0.783$\ PM分别为0.111美元。

translated by 谷歌翻译

Plant Species Classification Using Transfer Learning by Pretrained Classifier VGG-19

Thiru Siddharth , Bhupendra Singh Kirar , Dheeraj Kumar Agrawal

分类：计算机视觉 | (统计)机器学习

2022-09-07

深度学习目前是机器学习中最重要的分支，在语音识别，计算机视觉，图像分类和医学成像分析中的应用。植物识别是可以使用图像分类通过其叶子识别植物物种的领域之一。植物学家通过亲自检查将大量时间用于识别植物物种。本文描述了一种剖析瑞典叶子和识别植物物种的颜色图像的方法。为了实现更高的准确性，该任务是在预先训练的分类器VGG-19的帮助下使用转移学习完成的。分类的四个主要过程是图像预处理，图像增强，特征提取和识别，这些过程是作为整体模型评估的一部分进行的。 VGG-19分类器通过采用预定义的隐藏层（例如卷积层，最大池层和完全连接的层）来掌握叶子的特征，并最终使用Soft-Max层为所有植物类生成特征表示。该模型获得了与瑞典叶数据集的各个方面相关的知识，其中包含15种树类，并有助于预测未知植物的适当类别，准确性为99.70％，这比以前报告的研究工作高。

translated by 谷歌翻译

Context-Aware Streaming Perception in Dynamic Environments

Gur-Eyal Sela , Ionel Gog , Justin Wong , Kumar Krishna Agrawal , Xiangxi Mo , Sukrit Kalra , Peter Schafhalter , Eric Leong , Xin Wang , Bharathan Balaji

分类：计算机视觉

2022-08-16

有效的视觉在延迟预算下的精度最大化。这些作品一次评估脱机准确性，一次是一张图像。但是，诸如自动驾驶之类的实时视觉应用在流媒体设置中运行，在这些设置中，地面真相在推理开始和终点之间会发生变化。这会导致明显的准确性下降。因此，最近提出的一项旨在最大程度地提高流媒体设置准确性的工作。在本文中，我们建议在每个环境环境中最大化流的准确性。我们认为场景难度会影响初始（离线）精度差异，而场景中的障碍物位移会影响后续的准确性降解。我们的方法章鱼使用这些方案属性来选择在测试时最大化流量准确性的配置。我们的方法将跟踪性能（S-MOTA）提高了7.4％，而常规静态方法则提高了。此外，使用我们的方法提高性能，而不是离线准确性的进步，而不是代替而不是进步。

translated by 谷歌翻译

Image denoising in acoustic field microscopy

Shubham Kumar Gupta , Azeem Ahmad , Prakhar Kumar , Frank Melandso , Anowarul Habib

分类：计算机视觉

2022-08-07

由于显微镜图像被广泛用于生物医学或材料研究，因此已使用扫描声显微镜（SAM）。声学成像是无损测试（NDT），生物医学成像和结构健康监测的一种重要且建立的方法。这些成像经常以低振幅的信号进行，这可能导致引导液噪声，缺乏嘈杂的和缺乏的。图像信息的详细信息。在这项工作中，我们试图分析从低振幅信号中获取的SAM图像，并在时间域信号上使用块匹配过滤器以获得DeNocer的图像。我们已经将图像与在时间域信号上应用的常规过滤器进行了比较，例如高斯滤波器，中值滤波器，Wiener滤波器和总变化过滤器。著名的结果在本文中显示。

translated by 谷歌翻译

IterMiUnet: A lightweight architecture for automatic blood vessel segmentation

Ashish Kumar , R. K. Agrawal , Leve Joseph

分类：计算机视觉 | 机器学习

2022-08-02

眼底图像中血管的自动分割可以帮助分析视网膜脉管系统的状况，这对于确定各种全身性疾病（如高血压，糖尿病等）至关重要大量参数化，因此在实际应用中使用有限。本文提出了Itermiunet，这是一种新的基于轻量级卷积的细分模型，需要更少的参数，但提供了类似于现有模型的性能。该模型利用了ITERNET体系结构的出色分割功能，但通过将Miunet模型的编码器解码器结合在其中克服了严重的参数化性质。因此，新模型可减少参数，而不会与网络的深度进行任何妥协，这对于在深模型中学习抽象的层次概念是必不可少的。这种轻巧的分割模型可以加快训练和推理时间的速度，并且在数据稀缺的医疗领域可能会有所帮助，因此，大量参数化的模型往往过于拟合。在三个公开可用的数据集上评估了所提出的模型：驱动器，凝视和Chase-DB1。还进行了进一步的交叉培训和评估者之间的变异性评估。提出的模型具有很大的潜力，可以用作早期诊断许多疾病的工具。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

A Dataset for Interactive Vision-Language Navigation with Unknown Command Feasibility

Andrea Burns , Deniz Arsan , Sanjna Agrawal , Ranjitha Kumar , Kate Saenko , Bryan A. Plummer

分类：自然语言处理 | 计算机视觉

2022-02-04

视觉语言导航（VLN）在其视觉环境中遵循语言指令，在该前提是输入命令在环境中完全可行的前提下进行了研究。然而，实际上，由于语言歧义或环境的变化，可能无法提出要求。为了使用未知命令可行性研究VLN，我们引入了一个新的数据集移动应用程序任务，并使用迭代反馈（Motif），目标是在移动应用程序中完成自然语言命令。移动应用程序提供了一个可扩展的域来研究VLN方法的下游用途。此外，移动应用命令为交互式导航提供了指令，因为它们通过单击，键入或刷新而导致状态更改的动作序列。主题是第一个包含可行性注释的主题，其中包含二进制可行性标签和细粒度标签，原因是为什么任务不满意。我们进一步收集了模棱两可的查询的后续问题，以使解决任务不确定性解决。配备了我们的数据集，我们提出了可行性预测的新问题，其中使用自然语言指令和多模式应用程序环境来预测命令的可行性。主题提供了一个更现实的应用数据集，因为它包含许多不同的环境，高级目标和更长的动作序列。我们使用主题评估交互式VLN方法，量化当前方法对新应用环境的概括能力，并衡量任务可行性对导航性能的影响。

translated by 谷歌翻译

Semantic Segmentation of Legal Documents via Rhetorical Roles

Vijit Malik , Rishabh Sanjay , Shouvik Kumar Guha , Shubham Kumar Nigam , Angshuman Hazarika , Arnab Bhattacharya , Ashutosh Modi

分类：自然语言处理 | 人工智能 | 机器学习

2021-12-03

法律文件是非结构化的，使用法律术语，并且具有相当长的长度，使得难以通过传统文本处理技术自动处理。如果文档可以在语义上分割成连贯的信息单位，法律文件处理系统将基本上受益。本文提出了一种修辞职位（RR）系统，用于将法律文件分组成语义连贯的单位：事实，论点，法规，问题，先例，裁决和比例。在法律专家的帮助下，我们提出了一套13个细粒度的修辞标志标签，并创建了与拟议的RR批发的新的法律文件有条件。我们开发一个系统，以将文件分段为修辞职位单位。特别是，我们开发了一种基于多任务学习的深度学习模型，文档修辞角色标签作为分割法律文件的辅助任务。我们在广泛地尝试各种深度学习模型，用于预测文档中的修辞角色，并且所提出的模型对现有模型显示出卓越的性能。此外，我们应用RR以预测法律案件的判断，并表明与基于变压器的模型相比，使用RR增强了预测。

translated by 谷歌翻译

On the utility of power spectral techniques with feature selection techniques for effective mental task classification in noninvasive BCI

Akshansh Gupta , Ramesh Kumar Agrawal , Jyoti Singh Kirar , Javier Andreu-Perez , Wei-Ping Ding , Chin-Teng Lin , Mukesh Prasad

分类：机器学习

2021-11-16

在本文中，正在研究精神任务 - 根脑 - 计算机接口（BCI）的分类，因为这些系统是BCI中的主要调查领域，因为这些系统可以增强具有严重残疾人的人们的生命。 BCI模型的性能主要取决于通过多个通道获得的特征向量的大小。在心理任务分类的情况下，培训样本的可用性最小。通常，特征选择用于通过摆脱无关紧要和多余的功能来增加心理任务分类的比率。本文提出了一种为精神任务分类选择相关和非冗余频谱特征的方法。这可以通过使用四个非常已知的多变量特征选择方法VIZ，BHATTACHARYA的距离，散射矩阵的比率，线性回归和最小冗余和最大相关性。这项工作还涉及对心理任务分类的多元和单变量特征选择的比较分析。在应用上述方法后，研究结果表明了精神任务分类的学习模型的性能的大量改进。此外，通过执行稳健的排名算法和弗里德曼的统计测试来认识所提出的方法的功效，以找到最佳组合并比较功率谱密度和特征选择方法的不同组合。

translated by 谷歌翻译

Skillful Twelve Hour Precipitation Forecasts using Large Context Neural Networks

Lasse Espeholt , Shreya Agrawal , Casper Sønderby , Manoj Kumar , Jonathan Heek , Carla Bromberg , Cenk Gazen , Jason Hickey , Aaron Bell , Nal Kalchbrenner

分类：机器学习

2021-11-14

由于其对人类生命，运输，粮食生产和能源管理的高度影响，因此在科学上研究了预测天气的问题。目前的运营预测模型基于物理学，并使用超级计算机来模拟大气预测，提前预测数小时和日期。更好的基于物理的预测需要改进模型本身，这可能是一个实质性的科学挑战，以及潜在的分辨率的改进，可以计算令人望而却步。基于神经网络的新出现的天气模型代表天气预报的范式转变：模型学习来自数据的所需变换，而不是依赖于手工编码的物理，并计算效率。然而，对于神经模型，每个额外的辐射时间都会构成大量挑战，因为它需要捕获更大的空间环境并增加预测的不确定性。在这项工作中，我们提出了一个神经网络，能够提前十二小时的大规模降水预测，并且从相同的大气状态开始，该模型能够比最先进的基于物理的模型更高的技能HRRR和HREF目前在美国大陆运营。可解释性分析加强了模型学会模拟先进物理原则的观察。这些结果代表了建立与神经网络有效预测的新范式的实质性步骤。

translated by 谷歌翻译